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BESCHREIBUNG 

Verfahren zur automatischen Generierung einer textlichen 
AuBerung aus einer Bedeutungsreprasentation durch ein 

Computersystem 

Die Erfindung betrifft ein Verfahren zur automatischen 
Generierung einer textlichen Auflerung aus einer 
Bedeutungsreprasentation durch ein Computersystem. 

Bei einer immer grower werdenden Anzahl von Anwendungen 
eines Computersystems ist es vorteilhaft oder gar notwendig, 
bestimmte Inhalte an den Benutzer zu kommunizieren. 
Beispielsweise bei einem Fahrplanauskunf tssystem sollte das 
Computersystem die erwiinschte Fahrplanauskunf t als Text dem 
Benutzer anzeigen konnen. Der Text sollte dabei nicht nur 
z.B. die Abfahrzeiten enthalten, sondern sollte dem Benutzer 
alle wesentlichen Inf ormationen in der Form von 
vollstandigen Satzen oder sonstigen textlichen Auflerungen 
ausgeben. Diese Inf ormationen konnen schriftlich auf einem 
Bildschirm angezeigt oder akustisch durch eine entsprechende 
natiirlichsprachliche Ausgabe uber einen Lautsprecher 
ausgegeben werden* 

Die Erzeugung von Text, insbesondere die Generierung von 
Satzen durch ein Computersystem ist bekannt. 

So ist es moglich, dafl in einem Speicher des Computersystems 
bestimmte Satze vollstandig abgespeichert werden, urn von den 
einzelnen Programmen wieder aufgerufen und zur Anzeige 
gebracht zu werden. Beispielsweise kann der Satz n Datei 
wurde nicht gefunden." abgespeichert und zu gegebener Zeit 
wieder aufgerufen werden. Derartige Verfahren zur 
Generierung von Satzen werden auch als "canned text systems" 
bezeichnet. Ersichtlich ist dieses Verfahren nicht fur eine 
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grofle Anzahl von Satzen und auch nicht fur eine variable 
Satzgenerierung einsetzbar. 

Ebenfalls ist es moglich, da/3 in dem Speicher nur Teile 
eines bestimmten Satzes abgespeichert sind, die bei deren 
Abruf von dem Computersystem variabel erganzt werden. 
Belspielsweise kann der Satz "Die gewuschte Telef onnummer 
lautet im Speicher des Computersys terns abgespeichert 

sein. Bei dessen Abruf kann das Computersystem die 
betreffende Telef onnummer einsetzen und den vollstandigen 
Satz an den Benutzer ausgeben. Ein solches System zur 
Satzgenerierung wird auch als "template system" bezeichnet. 
Es erlaubt zwar ein gewisse variable Satzgenerierung, ist 
aber in seiner Flexibilitat trotzdem noch sehr begrenzt. 

Schliefilich ist es moglich, mit Hilfe von wissensbasierten 
linguistischen Systemen verschiedenartige Satze durch ein 
Computersystem variabel zu erzeugen. Dabei werden von dem 
Computersystem sogenannte Bedeutungsreprasentationen 
ermittelt, die beispielsweise die an den Benutzer 
auszugebenden Inf ormationen in einem nicht-satzgebundenen 
und nicht-grammatikalischen Format enthalten. Diese muB von 
dem Computersystem in textliche Auflerungen Oder vollstandige 
Satze umgewandelt werden, Derartige Systeme zur Generierung 
von textlichen Auflerungen aus Bedeutungsreprasentationen 
erfordern einen hohen Aufwand an Speicherplatz, Rechenzeit 
und Entwicklungstatigkeit, so daB sie bisher nur fur 
bestimmte, eng begrenzte Generierungsaufgaben vorhanden 
sind. 

Aufgabe der Erfindung ist es, ein Verfahren zur 
automatischen Generierung einer textlichen Auflerung aus 
einer Bedeutungsreprasentation durch ein Computersystem zur 
Verfiigung zu stellen, das fiir moglichst groBe Anzahlen von 
Bedeutungsreprasentationen und moglichst variabel eingesetzt 
werden kann, das aber trotzdem nur einen vertretbaren 
Aufwand an Speicherplatz und Rechenzeit erfordert. 



- 3 - 



GE 998 005 



Diese Aufgabe wird bei der Erfindung durch ein Verfahren zur 
automatischen Generierung einer AuBerung aus einer 
Bedeutungsreprasentation nach dem Anspruch 1 gelost. 

Die Erfindung verwendet ein statistisches Modell zur 
Ermittlung einer AuBerung aus einer ; 

Bedeutungsreprasentation. Bei der ermittelten Auflerung 
handelt es sich damit urn die wahrscheinlichste Auflerung, die 
auf der Grundlage des statistischen Modells der vorgegebenen 
Bedeutungsreprasentation zugeordnet werden kann. 

Damit wird erreicht, dafl die Vorteile der bekannten "canned 
text systems", insbesondere deren schn^lle Zugreif barkeit , 
weitgehehd erhalten bleiben. Gleichzeitig wird jedoch die 
Anzahl der zur Verfiigung stehenden AuBerungen nahezu 
unbegrenzt. 

Die Entwicklung von Programmcode zu den 

Generierungsschritten wird von dem statistischen Modell und 
dessen Entwicklung streng getrennt. Damit wird die 
Erweiterung des Verfahrens und dessen gegebenenf alls 

erf orderliche Anpassung wesentlich erleichtert. 

i 

Ein Wechsel beispielsweise von der deutschen zu der 
englischen Sprache kann allein durch einen Austausch der 
deutschsprachigen durch eine englischsprachige Ubersetzung 

innerhalb des statistischen Modells erreicht werden, was 

I 

eine erheblich Verminderung des Entwicklungsaufwands 
bedeutet. 

Fur die Ermittlung des statistischen Modells konnen 
bekannte, vorhandene Verfahren oder Programme verwendet 
werden, was ebenfalls zu einem geringeren Auf wand bei der 
Entwicklung des gesamten Verfahrens fiihrt. 

Ebenfalls ist es moglich, dafl fur nicht in dem statistischen 
Model 1 enthal tene Bedeutungsreprasentationen zumindes t 
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brauchbare textliche Auflerungen erzeugt werden. Damit ist 
das Verfahren auch zur Verarbeitung von neuen 
Bedeutungsreprasentationen geeignet. 

Des weiteren weist das erf indungsgemafle Verfahren keinen 
besonders hohen Speicherplatzbedarf auf und ist auch im 
Hinblick auf seine Rechenzeit bei der Generierung 
unkritisch. Es besitzt somit nicht die Nachteile von 
wissensbasierten linguistischen Systemen. 

Durch die Uberfiihrung der Bedeutungsreprasentationen und der 
zugehorigen Auflerungen in ein internes Format ist es 
moglich, den Korpus und das daraus entstehende statistische 
Modell zu vereinf achen . Insbesondere der Speicherplatzbedarf 
wird dadurch weiter vermindert. Ebenfalls konnen fiir die 
statistische Verarbeitung irrelevante Informationen 
ausgefiltert werden. Das Modell wird dadurch besser und kann 
schneller berechnet werden, 

Durch die Einfiihrung von Generalisierungen ist es moglich, 
die Anzahl der zur Verfugung stehenden Auflerungen praktisch 
unbegrenzt zu erweitern, ohne hierdurch die Anf orderungen an 
den Speicherplatzbedarf und die Rechenzeit wesentlich zu 
erhohen. Umgekehrt wird ein Korpus durch Zusammenf assung 
aquivalenter Eintrage kompakter und das zu berechnende 
statistische Modell robuster und akkurater. 

Weitere Merkmale, Anwendungsmoglichkeiten und Vorteile der 
Erfindung ergeben sich aus der nachf olgenden Beschreibung 
von Ausfiihrungsbeispielen der Erfindung, die in den Figuren 
der Zeichnung dargestellt sind. Dabei bilden alle 
beschriebenen oder dargestellten Merkmale fiir sich oder in 
beliebiger Kombination den Gegenstand der Erfindung, 
unabhangig von Ihrer Zusammenf assung in den Patentanspriichen 
oder deren Riickbeziehung sowie unabhangig von ihrer 
Formulierung bzw. Darstellung in der Beschreibung bzw. in 
der Zeichnung. 



GE 998 005 

- 5 - 



Figur 1 zeigt eine schematische Darstellung eines 

Verfahrens zur Ermittlung eines statistischen 
Modells, 

Figur 2 zeigt eine schematische Darstellung eines 

Verfahrens zur Generierung von XuBerungen auf der 
Grundlage des statistischen Modells der Figur 1, 

Figur 3 zeigt eine schematische Darstellung eines 

Verfahrens zur Generalisierung eines Korpus, aus 
dem ein generalisiertes statistisches Modell 
entsprechend der Figur 1 ermttelt wird, und 

Figur 4 zeigt eine schematische Darstellung eines 
\ Verfahrens zur Generierung von Aufierungen auf der 

Grundlage des generalisierten statistischen 
Modells der Figur 3. 

Ausgangspunkt fur das Verfahren zur Berechnung eines 
statistischen Modells nach der Figur 1, wie auch fur das 
Verfahren zur Generierung von Auflerungen nach der Figur 2 
sind Paare von Bedeutungsreprasentationen und zugehorigen 
Aufierungen. Aus einer Vielzahl derartiger Paare wird in 
einem vorbereitenden Schritt - dem Verfahren nach der Figur 
1 - ein statistisches Modell ermittelt, das danach - im 
Verfahren nach der Figur 2 -immer wieder zum Zwecke der 
Generierung von Satzen durchsucht wird. 



Die Darstellungsweise von Bedeutungsreprasentationen und 
zugehorigen Auflerungen ist vorgegeben und wird als extern 
bezeichnet, Diese externe Darstellungsweise der Paare von 
Bedeutungsreprasentationen und zugehorigen AuBerungen kann 
beispielsweise wie folgt gegeben sein: 



Bedeutungsreprasentation, externe Darstellungsweise : 
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f rom_until ( 15 , 14 ) , 
def (17,12, ll,htl90) , 
mofy( 13, 11 ,apr ) , 
dofm(14,i2,il,27) , 
dofm(15,i2,i3,23) ... 

zugehorige Auiierung, externe Darstellungsweise : 

"From the 23rd to the 27th of April" 

Es 1st moglich, da/5 diese externe Darstellungsweise 
unabhangig von anderen Progranunen des Computersystems 
erstellt wird. Ebenfalls ist es moglich, daii sich diese oder 
eine beliebige andere Darstellungsweise aus der Verwendung 
von anderen Progranunen des Computersystems ergibt. 
Beispielsweise kann sich die Darstellungsweise aus der 
Verwendung eines Ubersetzungsprogramms Oder eines 
Spracherkennungsprogramms oder dergleichen ergeben, die die 
jeweilige externe Darstellungsweise bereits verwehden. 

In der externen Darstellungsweise werden eine Vielzahl von 
Paaren von Bedeutungsreprasentationen und von zugehorigen 
AuBerungen in das Computersystem eingegeben und dort in 
einem Speicher abgespeichert . 

Die Paare von Bedeutungsreprasentationen und zugehorigen 
AuBerungen konnen entweder manuell dem Computersystem - 
eingegeben werden. In diesem Fall kann eine Person genau 
diejenigen Bedeutungsreprasentationen und zugehorigen 
AuBerungen in das Computersysstem eingeben, die fur die 
betreffende Anwendung sinnvoll oder notwendig sind. 
Ebenfalls ist es moglich, dafl die Paare von 
Bedeutungsreprasentationen und zugehorigen Auflerungen von 
einem anderen Programm, beispielsweise von dem 
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Ubersetzungsprogramm Oder dem Spracherkennungsprogramm 
iibernommen und in dem Computersystem abgespeichert werden. 

Samtliche in das Computersystem eingegebene Paare von 
Bedeutungsreprasentationen und zugehorigen Auflerungen 
stellen einen Korpus dar. Je umf angreicher dieser Korpus 
ist, desto umf angreicher sind auch. die Moglichkeiten einer 
spateren Generierung von Auflerungen durch das 
Computersystem. 

Ausgehend von diesem Korpus ermittelt das Computersystem 
&C) \ nach dem Verfahren der Figur 1 ein statistisches Modell. 

Hierzu wird der Korpus in einem Schritt 14 zuerst von der 
externen Darstellungsweise in ein internes Format uberf uhrt . 
Die Paare C werden also in Paare Cinternal abgebildet. Zur 
Durchfuhrung dieses Schritts wird eine Negatiyliste 12 und 
eine Ubersetzungstabelle 13 verwendet . Das interne Format 
stellt eine Vereinf achung der externen Darstellungsweise des 
Korpus dar, die auf die durchzuf iihrende Ermittlung eines 
statistischen Modells ausgerichtet bzw. auf diese beschrankt 
1st. 

Die Negativliste beschreibt Inf ormationen, die 
gegebenenf alls in der externen Darstellung enthalten sind, 
die aber fur das statistische Modell irrelevant oder sogar 
schadlich sind. Diese Inf ormationen finden sich in der 
internen Darstellung nicht wieder. Die Ubersetzungstabelle 
stellt den Bezug von Teilen der externen Darstellung zu 
Teilen der internen Darstellung her. 

Beispielsweise wird das eingangs genannte Paar einer 
Bedeutungsreprasentation und der zugehorigen Auflerung wie 
folgt von der externen Darstellungsweise in das interne 
Format iiberfiihrt: 
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Bedeutungsreprasentation, internes Format: 

frorn_until,def , 11,12,13, 11, ... ,17, 
dofm(27th,23rd) ,mofy(April) 

zugehorige Aufierung, internes Format: 

f rom, the, 2 3rd, to, the, 2 7th, of , April 

Der nunmehr im intemen Format vorhandene Korpus bildet die 
Grundlage zur Ermittlung eines statistischen Modells. Dazu 
werden von dem Computersystem in einem Schritt 14 eine 
Vielzahl von Fragen Qstart bestimmt, mit denen die einzelnen 
Eintrage des Korpus klassif iziert werden konnen. Dariiber 
hinaus ist es moglich, dafl auch manuell eine Anzahl von 
initialisierenden Fragen 15 vorgegebenen werden konnen* 

Aus diesen Fragen berechnet das Computersystem anhand von 
bekannten Verfahren in einem Schritt 16 zu dem vorhandenen 
Korpus ein statistisches Modeli. Dabei werden zu jedem 
Bestandteil der vorhandenen Bedeutungsreprasentationeri von 
dem Computersystem Fragen erzeugt, so dafl die jeweiligen 
Bestandteile klassif iziert werden. Auf diese Weise ermittelt 
das Computersystem beispielsweise ein statistisches 
Entscheidungsbaummodell T. 

Im Hinblick auf die Erzeugung dieser Fragen konnen 
vorgegebene Randbedingungen eine Rolle spielen, 
beispielsweise dafi das entstehende Entscheidungsbaummodell 
moglichst ausgewogen sein soil oder dergleichen. 

Das im Schritt 16 berechnete Model 1 T wird im Computersystem 
abgespeichert . Die Ermittlung dieses Modells T, also das 
Verfahren nach der Figur 1 wird einmalig durchlaufen, und 
zwar vor der eigent lichen Generierung von Ausdriicken nach 
dem Verfahren der Figur 2. Das letztgenannte Verfahren 
erfolgt danach auf der Grundlage des ermittelten Modells T. 



• + 

GE 998 005 

- 9 - 

Bel clem Verf ahren nach der Figur 1 werden also Paare C von 
Bedeutungsreprasentationen und deren zugehorige AuBerungen 
von der externen Darstellungsweise in das interne Format 
iiberfuhrt, urn danach aus den Paaren Cihternal das 
statistische Modell T zu ermitteln. Diese Schritte werden 
automatisch von dem Computersystem durchgef iihrt . 

Auf der Grundlage des statistischen Modells T kann das 
Computersystem nach dem Verfahren der Figur 2 Aufierungen 
generieren. 

Hierzu wird dem Computersystem eine Bedeutungsreprasentation 
als Eingabe i zugef iihrt. Diese wird in einem Schritt 21 
zuerst wieder von der externen Darstellungsweise in das 
interne Format iiberf iihrt. Hierzu werden wieder die 
Negativliste 12 und die Ubersetzungstabelle 13 verwendet. 
Nach dem Schritt 21 liegt somit die Bedeutungsreprasentation 
als Eingabe iinternal vor. 

In einem Schritt 22 wird das statistische Modell T 
durchsucht. Dieses ist beispielsweise - wie bereits 
erlautert wurde - als Entscheidungsbaummbdell 23 in dem 
Computersystem abgespeichert. Es werden somit zu der in das 
interne Format iiberfiihrten Bedeutungsreprasentation die 
bereits erwahnten Fragen gestellt und es werden 
beispielsweise parallel eine bestimmte Anzahl alternativer 
Antworten weiterverf olgt , die aufgrund des Modells T und der 
Eingabe i die hochste Wahrscheinlichkeit besitzen. 

Auf diese Weise wird eine statistische Suche in dem 
Entscheidungsbaummodell von dem Computersystem durchgef iihrt , 
mit der die am besten passende Auflerung zu der vorgegebenen 
Bedeutungsreprasentation ermittelt wird. Diese AuBerung 
stellt eine Ausgabe ointernal dar, die noch in dem internen 
Format vorliegt. 
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In einem Schritt 24 wird das interne Format der Ausgabe 
ointernal wieder in die externe Darstellungsweise 
ruckuberfuhrt, so daB nunmehr die ermittelte AuBerung als 
Ausgabe o in der externen Darstellungsweise vorliegt. 

Bei dem Verfahren nach der Figur 2 wird also die Eingabe i 
in das interne Format iiberfuhrt. Dann wird die Eingabe 
iinternal anhand des statistischen Modells klassif iziert , urn 
die am besten passende Ausgabe ointernal zu ermitteln. Diese 
wird schlieBlich wieder in die Ausgabe o der externen 
Darstellungsweise ruckuberfuhrt. Diese Schritte werden 
automatisch von dem Computersystem durchgef uhrt . 

Gegebenenfalls ist es moglich, daB nach der Ermittlung der 
am besten passenden AuBerung noch die Korrektheit dieser 
AuBerung mit Hilfe von zusatzlichen Verfahren durch das 
Computersystem iiberpruft wird. 

Das Verfahren nach der Figur 2 und gegebenenfalls die 
genannten zusatzlichen Verfahren werden fur jede Eingabe i 
durchlaufen, so daB fur jede Eingabe i, also fur jede 
Bedeutungsreprasentation, eine zugehorige Ausgabe o, also 
eine zugehorige AuBerung von dem Computersystem erzeugt 
wird. 

Zur Erhohung der Leistungsf ahigkeit der vorbeschriebenen 
Verfahren ist es moglich, den aus Paaren von 
Bedeutungsreprasentationen und zugehorigen AuBerungen 
bestehenden Korpus zu generalisieren. 

Zu diesem Zweck werden bestimmte, miteinander 
korrespondierende Telle der Bedeutungsreprasentationen und 
der zugehorigen AuBerungen, die sich verallgemeinern lassen, 
und die immer wieder auftreten, durch sogenannte Patterns 
bzw. Templates verallgemeinert . So wird beispielsweise ein 
bestimmter Monat nicht mehr als solcher in den Korpus 
ubernommen, sondern als verallgemeinerter Monat. Bei der 
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Generierung von Aufierungen wird dann die Zuordnung des 
verallgemeinerten Monats zu dem bestinunten Monat vorab in 
dem Computersystem abgespeichert , urn danach in die 
ermittelte Auflerung wieder eingesetzt werden zu konnen. 



Beispielhaft kann eine Generalisierung der 

Bedeutungsreprasentationen und der zugehorigen Auflerungen 
wie folgt von dem Computersystem vorgenommen werden: 

Bedeutungsreprasentationen : zugehorige Auflerungen : 

"\ externe Darstellungsweise : 

r , 

mofy(13,il,apr) , "From the 23rd to 

dofm(14,i2,il,27) , the 27th of April" 

dofm(16,i2,i3,23) , 



internes Format: 



f rom_until,def , il , i2 , i3, 
11, ... ,17/ 
dofm(27th,23rd) , 
mofy( April) 



from, the, 2 3rd, to, 
t he , 2 7 1 h , o f , Apr i 1 



generalisiertes Format : 



from_until,def , il, i2, i3, 
11,. ..,17, 
do f m ( Vdo f m 1 , Vdo f m2 ) 
mofy ( Vmofyl ) 



from, the, Vdof m2 , to 
the, Vdof m2 , of , Vmofyl 



In dem generalisierten Format ist beispielsweise der 
bestimmte Monat "April" durch den verallgemeinerten Monat 
"Vmofyl" ersetzt. Der Korpus enthalt also nicht mehr den 
bestimmten Monat "April", sondern nur noch den 
verallgemeinerten Monat "Vmofyl". Entsprechendes gilt z.B. 
fur den bestimmten Monat "Juni", der in dem Korpus ebenfalls 
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durch denselben verallgemeinerten Monat "Vmofyl" 
reprasentiert wird. Durch die Generalisierung werden also in 
diesem Fall die bestimmten Monate des Jahres "Januar, 
Februar, . . . Dezember" durch den verallgemeinerten Monat 
"Vmofyl" substituiert . 

Ausgehend von den im internen Format vorliegenden Paaren 
Cinternal von Bedeutungsreprasentationen und zugehorigen 
Auflerungen ermittelt das Computersystera entsprechend der 
Figur 3 Paare Cgeneralized, die dann in einem 

generalisierten Format, vorliegen. Diese Generalisierung wird 
fur alle einzelnen Paare cinternal durchgef uhrt , die jeweils 
in Paare cgeneralized iiberfiihrt werden. 

Bei dem Verfahren nach der Figur 3 wird jedes Paar des 
Korpus von dem Computersystem auf mogliche Substitutionen 
iiberpruft. Die Substitutionen konnen dabei manuell 
vorgegeben werden, oder sie konnen gegebenenf alls auch von 
dem Computersystem automatisch ermittelt werden* Die 
Substitutionen sind in dem Speicher des Computersys terns 
abgespeichert . In der Figur 3 sind die Substitutionen mit 
der Bezugsziffer 31 gekennzeichnet. 

Auf der Grundlage dieser Substitutionen 31 wird die in dem 
internen Format vorliegende Bedeutungsreprasentation 
iinternal eines bestimmten Paares cinternal in einem Schritt 
32 in eine in dem generalisierten Format vorliegende 
Bedeutungsreprasentation ipattern uberfuhrt. In 
entsprechender Weise wird die in dem internen Format 
vorliegende zugehorige AuBerung ointernal des bestimmten 
Paares cinternal in einem Schritt 33 in eine in dem 
generalisierten Format vorliegende AuBerung otemplate 
iiberfiihrt* Insgesamt entsteht damit zu jedem in dem internen 
Format vorliegenden Paar cinternal ein in dem 
generalisierten Format vorliegendes Paar cgeneralized, das 
sich aus der jeweiligen Bedeutungsreprasentation ipattern 
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und der zugehorigen Au/ierung otemplate jeweils im 
generalisierten Format zusammensetzt. 

Danach wird aus den Paaren Cgeneralized in derselben Weise 
ein generalisiertes statistisches Modell T ' durch das 
Computersystem ermittelt, wie dies im Zusammenhang mit dem 
Verfahren nach der Figur 1 bereits erlautert worden ist. Das 
entstehende Entscheidungsbaummodell unterscheidet sich von 
demjenigen der Figur 1 im wesentlichen dadurch, dafl in ihm 
die abgespeicherten Substitutionen 31 enthalten sind, da/i 
also anstelle von bestimmten Monaten "April" oder "Juni" 
Oder dergleichen deren Substitution "Vmofyl" vorhanden ist. 

Auf der Grundlage des generalisierten statistischen Modells 
T* kann das Computersystem nach dem Verfahren der Figur 4 
Auflerungen generieren. 

Hierzu wird dem Computersystem eine Bedeutungsreprasentation 
als Eingabe i zugeftihrt. Diese wird in einem Schritt 41 
zuerst wieder von der externen Darstellungsweise in das 
interne Format liber ftihrt. Hierzu werden wieder die 
Negativliste 12 und die Ubersetzungstabelle 13 verwendet. 
Nach dem Schritt 41 liegt somit die Bedeutungsreprasentation 
als Eingabe iinternal vor. 

In einem Schritt 42 wird das generalisierte statistische 
Modell T ' durchsucht. Dieses ist als Entscheidungsbaummodell 
4 3 in dem Computersystem abgespeichert . Auf diese Weise wird 
eine statistische Suche in dem Entscheidungsbaummodell von 
dem Computersystem durchgef uhrt, mit der die am besten 
passende Auiierung zu der vorgegebenen 

Bedeutungsreprasentation ermittelt wird. Diese Auflerung kann 
- aufgrund, der dem statistischen Modell T ' zugrundeliegenden 
Generalisierungen - Substitutionen enthalten. 



In einem Schritt 44 speichert das Computersystem etwa 
zeitgleich mit dem Schritt 42 die in den 



GE 998 005 

- 14 - 

Bedeutungsreprasentationen iinternal tatsachlich 
vorkommenden Substitutionen mit ihrem jeweiligen bestimmten 
Inhalt in seinem Speicher ab. 

Die sich aus dem Schritt 43 ergebenden vorlaufigen 
AuBerungen und die in dem Schritt 44 gespeicherten 
Substitutionen werden in einem Schritt 45 derart 
iiberarbeitet , da/i die vorhandenen Substitutionen wieder 
ersetzt werden. . Es wird also der gespeicherte Inhalt nunmehr 
wieder anstelle der Substitution in die vorlaufige Auflerung 
eingesetzt, so da/3 die endgiiltige AuBerung zu der eingangs 
vorgegebenen Bedeutungsreprasentation entsteht. Diese 
Auflerung stellt eine Ausgabe ofilled dar, die noch in dem 
internen Format vorliegt. 

In einem Schritt 46 wird das interne Format der Ausgabe 
ofilled wieder in die externe Darstellungsweise 
riickiiberfuhrt, so dafl nunmehr die ermittelte AuBerung als 
Ausgabe o in der externen Darstellungsweise vorliegt. 
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Pa tentansprtlche 

Verfahren zur automatischen Generierung einer 

text lichen Auflerung aus einer Bedeutungsreprasentation 

durch ein Computersystem mit den folgenden Schritten: 

a) es wird ein statistisches Modell auf einer 
Vielzahl von vorgegebenen Paaren von 
Bedeutungsreprasentationen und zugehorigen 
Aufierungen durch das Computersystem ermittelt und 
abgespeichert , 

b) es wird dem Computersystem eine 
Bedeutungsreprasentation vorgegeben, 

c) aus der Bedeutungsreprasentation wird von dem 
Computersystem mittels des statistischen Modells 
eine zugehorige Aufierung ermittelt, 

d) die Schritte b) und c) werden von dem 
Computersystem gegebenenf alls fur weitere 
Bedeutungsreprasentationen wiederholt . j 

Verfahren nach einem der vorstehenden Anspriiche, mit 
den weiteren Schritten: 

vor dem Schritt a) werden die Paare von 
Bedeutungsreprasentationen und zugehorigen Auflerungen 
in ein internes Format iiberfuhrt, 

nach dem Schritt b) wird die Bedeutungsreprasentation 
in das interne Format iiberfuhrt, 

nach dem Schritt c) wird die ermittelte Auflerung aus 
dem internen Format ruckiiberf uhrt . 
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Verfahren nach einem der vorstehenden Anspriiche, mit 
den weiteren Schritten: 

vor dem Schritt a) werden die Paare yon 
Bedeutungsreprasentationen und zugehorigen Auflerungen 
mit Hilfe von Substitutionen in ein generalisiertes 
Format iiberfuhrt, 

nach dem Schritt c) wird die ermittelte Auflerung mit 
Hilfe der Substitutionen vervollstandigt . 
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Zusammen fas sung 

Es wird ein Verfahren zur automatischen Generierung einer 
textlichen Auflerung aus einer Bedeutungsreprasentation durch 
ein Computersystem beschrieben. Bei dem Verfahren wird ein 
statistisches Modell auf einer Vielzahl von vorgegebenen 
Paaren von Bedeutungsreprasentationen und zugehorigen 
Aufierungen durch das Computersystem ermittelt und 
abgespeichert . Es wird dem Computersystem eine 
Bedeutungsreprasentation vorgegeben, aus der von dem 
Computersystem mittels des statistischen Modells eine 
zugehorige Auflerung ermittelt wird. Diese Schritte werden 
von dem Computersystem gegebenenf alls fur weitere 
Bedeutungsreprasentationen wiederholt . 
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